BAN%20NOTEBOOK%20P3.png

Créez un dataframe contenant les informations de population de chaque pays. Calculez le nombre total d’humains sur la planète. Critiquez votre résultat. En cas d’anomalie, analysez et effectuer les corrections nécessaires.

Question 1 : donnez le résultat de votre calcul pour l'année 2013

Parmi les documents sur les Bilans alimentaires que vous avez téléchargés, il y a des informations redondantes. En effet, pour un pays donné, certaines de ces informations peuvent se calculer à partir d'autres :

Production/ Importations/ Exportations/ Variation de stock/ Disponibilité intérieure/ Semences/ Pertes/ Nourriture, aussi appelée Disponibilité alimentaire/ Aliments pour animaux/ Traitement/ Autres utilisations

Question 2 : Identifiez ces redondances, en donnant votre réponse sous forme de formule mathématique. Faire intervenir chacune des 11 quantités données ci dessus. Illustrez cette équation avec l'exemple du blé en France

A partir de ces informations :

Population de chaque pays ; Disponibilité alimentaire donnée pour chaque produit et pour chaque pays en kcal/personne/jour. Disponibilité alimentaire en protéines donnée pour chaque produit et pour chaque pays en g/personne/jour.

Question 3 : Calculez (pour chaque pays et chaque produit) la disponibilité alimentaire en kcal puis en kg de protéines

Question 4 : A partir de ces dernières informations, et à partir du poids de la disponibilité alimentaire (pour chaque pays et chaque produit), calculez pour chaque produit le ratio "énergie/poids", que vous donnerez en kcal/kg.

Vous pouvez vérifier la cohérence de votre calcul en comparant ce ratio aux données disponibles sur internet, par exemple en cherchant la valeur calorique d'un oeuf.

Question 5 : Citez 5 aliments parmi les 20 aliments les plus caloriques, en utilisant le ratio énergie/poids.

Étonnamment, il arrive que ce ratio soit différent en fonction du pays. Il faudra donc réaliser pour chaque aliment une moyenne sur les différents pays. Vous créerez donc une nouvelle table grâce à une agrégation. Attention à bien retirer les valeurs égales à 0 afin de ne pas fausser le calcul de la moyenne.

Citez 5 aliments parmi les 20 aliments les plus riches en protéines.

Question 6 : Calculez, pour les produits végétaux uniquement, la disponibilité intérieure mondiale exprimée en kcal.

Sommaire // Question 1-5 🍌

1.Importation des librairies et parametres df

2.Importation des fichiers CSV

3.Nettoyage des différentes tables

3.1.Population

3.1.1.Valeurs manquantes, nulles et NA

J'ai remarqué en fin de table que la population totale de la chine etait compté deux fois.

3.1.2.Doublons

3.1.3.Q1_Population totale en 2013

3.2.Vegetaux

3.2.1.Valeurs manquantes, nulles et NA

3.2.2.Doublons

3.2.3.Q2_Disponibilité intérieure

3.3.Animaux

3.3.1.Valeurs manquantes, nulles et NA

3.3.2.Doublons

4.Manipulations des tables pour Q3

4.1.Concatenation des tables vegetaux et animaux

4.2.Jointure des tables vegetaux_animaux et population

4.3.Table Q3

5.Manipulations dataframe Q4

5.1.Table Q5

6.Manipulations dataframe Q5

6.1.Table Q5_1

6.2.Table Q5_2